本文档描述了Spotify出于学术研究目的发布的葡萄牙语播客数据集。我们概述了如何采样数据,有关集合的一些基本统计数据,以及有关巴西和葡萄牙方言的分发信息的简要信息。
translated by 谷歌翻译
Multimodal integration of text, layout and visual information has achieved SOTA results in visually rich document understanding (VrDU) tasks, including relation extraction (RE). However, despite its importance, evaluation of the relative predictive capacity of these modalities is less prevalent. Here, we demonstrate the value of shared representations for RE tasks by conducting experiments in which each data type is iteratively excluded during training. In addition, text and layout data are evaluated in isolation. While a bimodal text and layout approach performs best (F1=0.684), we show that text is the most important single predictor of entity relations. Additionally, layout geometry is highly predictive and may even be a feasible unimodal approach. Despite being less effective, we highlight circumstances where visual information can bolster performance. In total, our results demonstrate the efficacy of training joint representations for RE.
translated by 谷歌翻译
Chronic pain is a multi-dimensional experience, and pain intensity plays an important part, impacting the patients emotional balance, psychology, and behaviour. Standard self-reporting tools, such as the Visual Analogue Scale for pain, fail to capture this burden. Moreover, this type of tools is susceptible to a degree of subjectivity, dependent on the patients clear understanding of how to use it, social biases, and their ability to translate a complex experience to a scale. To overcome these and other self-reporting challenges, pain intensity estimation has been previously studied based on facial expressions, electroencephalograms, brain imaging, and autonomic features. However, to the best of our knowledge, it has never been attempted to base this estimation on the patient narratives of the personal experience of chronic pain, which is what we propose in this work. Indeed, in the clinical assessment and management of chronic pain, verbal communication is essential to convey information to physicians that would otherwise not be easily accessible through standard reporting tools, since language, sociocultural, and psychosocial variables are intertwined. We show that language features from patient narratives indeed convey information relevant for pain intensity estimation, and that our computational models can take advantage of that. Specifically, our results show that patients with mild pain focus more on the use of verbs, whilst moderate and severe pain patients focus on adverbs, and nouns and adjectives, respectively, and that these differences allow for the distinction between these three pain classes.
translated by 谷歌翻译
基于连续的潜在空间(例如变异自动编码器)的概率模型可以理解为无数混合模型,其中组件连续取决于潜在代码。它们具有用于生成和概率建模的表达性工具,但与可牵引的概率推断不符,即计算代表概率分布的边际和条件。同时,可以将概率模型(例如概率电路(PC))理解为层次离散混合模型,从而使它们可以执行精确的推断,但是与连续的潜在空间模型相比,它们通常显示出低于标准的性能。在本文中,我们研究了一种混合方法,即具有较小潜在尺寸的可拖动模型的连续混合物。尽管这些模型在分析上是棘手的,但基于一组有限的集成点,它们非常适合数值集成方案。有足够数量的集成点,近似值变得精确。此外,使用一组有限的集成点,可以将近似方法编译成PC中,以“在近似模型中的精确推断”执行。在实验中,我们表明这种简单的方案被证明非常有效,因为PC在许多标准密度估计基准上以这种方式为可拖动模型设定了新的最新模型。
translated by 谷歌翻译
加强学习中的序列模型需要任务知识来估计任务策略。本文提出了一种用于从演示中学习序列模型的层次结构算法。高级机制通过选择后者来达到的子目标来指导低级控制器。该序列取代了以前方法的回报,从而提高了其整体性能,尤其是在较长的情节和稀缺奖励的任务中。我们在OpenAigym,D4RL和Robomimic基准测试的多个任务中验证我们的方法。我们的方法的表现优于在不同的地平线任务中的八个任务中的八个基准和没有事先任务知识的奖励频率,这显示了使用序列模型从演示中学习的层次模型方法的优势。
translated by 谷歌翻译
细胞仪可实现异质种群中精确的单细胞表型。这些细胞类型传统上是通过手动门控来注释的,但是这种方法遭受了对批处理效应的重现性和敏感性的缺乏。同样,最新的细胞仪 - 光谱流或质量细胞仪 - 创建丰富而高维的数据,其通过手动门控进行分析变得具有挑战性且耗时。为了解决这些局限性,我们引入了SCYAN(https://github.com/mics-lab/scyan),这是一个单-Cell细胞仪注释网络,该网络仅使用有关细胞测量仪面板的先前专家知识自动注释细胞类型。我们证明,SCYAN在多个公共数据集上大大优于相关的最新模型,同时更快,可解释。此外,SCYAN克服了几项互补任务,例如批处理效应,脱钉和人口发现。总体而言,该模型可以加速和简化细胞群体的特征,定量和细胞仪的发现。
translated by 谷歌翻译
现代分布式系统受到耐故障算法的支持,例如可靠的广播和共识,即使系统的某些节点失败,也可以确保系统的正确操作。但是,分布式算法的开发是一个手动且复杂的过程,导致科学论文通常呈现单一算法或现有算法的变化。为了自动化开发此类算法的过程,这项工作提出了一种使用强化学习来生成正确且有效耐受性分布式分布式算法的智能代理。我们表明,我们的方法能够在仅12,000个学习剧集中生成正确的耐受性可靠的广播算法,而文献中的其他人则具有相同的性能。
translated by 谷歌翻译
在生成模型的背景下,近年来,文本到图像生成取得了令人印象深刻的结果。提出了使用不同方法的模型,并在大量的文本和图像对数据集中进行了培训。但是,某些方法依赖于预训练的模型,例如生成对抗网络,通过使用基于梯度的方法来更新潜在矢量的生成模型的潜在空间,并依赖于余弦功能(例如余弦功能)。在这项工作中,我们通过提出使用协方差矩阵适应演化策略来探索生成对手网络的潜在空间,从而遵循不同的方向。我们将这种方法与使用亚当和混合策略的方法进行了比较。我们设计了一项实验研究,以使用不同的文本输入来比较三种方法,通过根据所得样品的投影调整评估方法来比较图像生成,以检查分布的多样性。结果证明,进化方法在样品的产生中获得了更多的多样性,从而探索了所得网格的不同区域。此外,我们表明混合方法结合了基于梯度和进化方法的探索区域,利用结果的质量。
translated by 谷歌翻译
事实证明,在学习环境中,社会智能代理(SIA)的部署在不同的应用领域具有多个优势。社会代理创作工具使场景设计师能够创造出对SIAS行为的高度控制的量身定制体验,但是,另一方面,这是有代价的,因为该方案及其创作的复杂性可能变得霸道。在本文中,我们介绍了可解释的社会代理创作工具的概念,目的是分析社会代理的创作工具是否可以理解和解释。为此,我们检查了创作工具Fatima-Toolkit是否可以理解,并且从作者的角度来看,其创作步骤可以解释。我们进行了两项用户研究,以定量评估Fatima-Toolkit的解释性,可理解性和透明度,从场景设计师的角度来看。关键发现之一是,法蒂玛 - 库尔基特(Fatima-Toolkit)的概念模型通常是可以理解的,但是基于情感的概念并不那么容易理解和使用。尽管关于Fatima-Toolkit的解释性有一些积极的方面,但仍需要取得进展,以实现完全可以解释的社会代理商创作工具。我们提供一组关键概念和可能的解决方案,可以指导开发人员构建此类工具。
translated by 谷歌翻译
本文讨论了如何通过通过预处理和后处理方法增强光学特征识别(OCR)发动机来成功数字化大规模的历史微数据。尽管由于机器学习的改善,近年来OCR软件已大大改善,但现成的OCR应用程序仍然显示高错误率,这限制了其应用程序以准确提取结构化信息。但是,补充OCR可以大大提高其成功率,使其成为经济史学家的强大且具有成本效益的工具。本文展示了这些方法,并解释了为什么它们有用。我们将它们应用于两个大型资产负债表数据集,并引入Quipucamayoc,Quipucamayoc是一个统一框架中包含这些方法的Python软件包。
translated by 谷歌翻译